RStudio AI博客领域信息情报检索

欢迎来到我们的博客!在这里,您将找到关于使用与人工智能相关的技术(如TensorFlow和Keras等深度学习框架、分布式计算和自动化相关框架,如sparklyr和mlflow,以及数据摄取(pins))的最新新闻、见解和示例的信息。

sparklyr.sedona:用于分析地理空间数据的 sparklyr 扩展

sparklyr.sedona: A sparklyr extension for analyzing geospatial data

我们很高兴地宣布 sparklyr.sedona 现已推出,这是一个 sparklyr 扩展,可让 Apache Sedona 库的地理空间功能从 R 轻松访问。

sparklyr 1.7:新的数据源和 spark_apply() 功能、更好的 sparklyr 扩展接口等等!

sparklyr 1.7: New data sources and spark_apply() capabilities, better interfaces for sparklyr extensions, and more!

Sparklyr 1.7 提供了备受期待的改进,包括用于图像和二进制数据源的 R 接口、几个新的 spark_apply() 功能以及与 sparklyr 扩展的更好集成。

Que haja luz:为 torch 点亮更多光芒!

Que haja luz: More light for torch!

今天,我们介绍 luz,它是 torch 的高级接口,可让您以简洁、声明式的风格训练神经网络。从某种意义上说,它之于 torch 就像 Keras 之于 TensorFlow:它既提供了简化的工作流程,也提供了强大的自定义方式。

torch 用于优化

torch for optimization

Torch 不仅仅适用于深度学习。其 L-BFGS 优化器配备 Strong-Wolfe 线搜索,是无约束和约束优化的强大工具。

sparklyr 1.6:加权分位数摘要、幂迭代聚类、spark_write_rds() 等

sparklyr 1.6: weighted quantile summaries, power iteration clustering, spark_write_rds(), and more

sparklyr 1.6 版本引入了加权分位数摘要、用于支持迭代聚类的 R 接口、spark_write_rds(),以及许多与 dplyr 相关的改进。

torch 时间序列,最后一集:注意力

torch time series, final episode: Attention

我们通过使用一种在自然语言处理中非常流行且受人类(和动物)认知启发的技术来增强上次的序列到序列架构,从而结束使用 torch 进行时间序列预测的迷你系列:注意力。

torch 时间序列,第三集:序列到序列预测

torch time series, take three: Sequence-to-sequence prediction

在我们对时间序列预测技术的概述中,我们转向序列到序列模型。该系列中的架构通常用于自然语言处理 (NLP) 任务,例如机器翻译。然而,对于 NLP,在进行模型定义和训练之前需要进行大量的预处理。在熟悉的数值序列中,我们可以完全专注于概念。

torch 时间序列继续:首次尝试多步预测

torch time series continued: A first go at multi-step prediction

我们继续探索使用 torch 进行时间序列预测,转向为多步预测设计的架构。在这里,我们通过多层感知器 (MLP) 增强了“主力 RNN”,以推断未来的多个时间步。

使用 torch 进行入门时间序列预测

Introductory time-series forecasting with torch

这篇文章介绍了使用 torch 进行时间序列预测。核心主题是数据输入和 RNN(GRU/LSTM)的实际使用。即将发布的文章将以此为基础,并介绍越来越复杂的架构。

第一个 mlverse 调查结果 - 软件、应用程序及其他

First mlverse survey results – software, applications, and beyond

上个月,我们对 mlverse 软件进行了首次调查,涵盖的主题包括从应用领域到软件使用,再到用户的愿望和建议。此外,调查还询问了对 AI/ML 社会影响的看法。这篇文章介绍了调查结果,并试图解决一些出现的问题。

torch、tidymodels 和高能物理

torch, tidymodels, and high-energy physics

今天我们介绍 tabnet,这是“TabNet:专注可解释表格学习”的 torch 实现,与 tidymodels 框架完全集成。从本质上讲,tabnet 的设计只需要很少的数据预处理;多亏了 tidymodels,超参数调整(在深度学习中通常很麻烦)变得方便甚至有趣!

使用 torch 进行简单的音频分类

Simple audio classification with torch

本文将 Daniel Falbel 关于“简单音频分类”的文章从 TensorFlow/Keras 翻译成 torch/torchaudio。

预测厄尔尼诺-南方涛动 (ENSO)

Forecasting El Niño-Southern Oscillation (ENSO)

厄尔尼诺-南方涛动 (ENSO) 是一种大气现象,位于热带太平洋,极大地影响着全球大部分地区的生态系统和人类福祉。我们使用之前文章中介绍的 convLSTM 从空间有序的海面温度序列预测 Niño 3.4 指数。

用于空间预测的卷积 LSTM

Convolutional LSTM for spatial forecasting

在预测空间确定的现象(例如天气或电影中的下一帧)时,我们希望对时间演变进行建模,理想情况下使用递归关系。同时,我们希望有效地提取空间特征,这通常是使用卷积滤波器完成的。理想情况下,我们将拥有一个既是循环又是卷积的架构。在这篇文章中,我们使用 torch 构建了一个卷积 LSTM。

torch 0.2.0 - 初始 JIT 支持和许多错误修复

torch 0.2.0 - Initial JIT support and many bug fixes

torch 0.2.0 版本包含许多错误修复和一些不错的新功能,如初始 JIT 支持、多工作器数据加载器、新优化器和 nn_modules 的新打印方法。

sparklyr 1.5:更好的 dplyr 接口、更多 sdf_* 函数和基于 RDS 的序列化例程

sparklyr 1.5: better dplyr interface, more sdf_* functions, and RDS-based serialization routines

与之前的所有三个 sparklyr 版本不同,最近发布的 sparklyr 1.5 更注重增强现有的 sparklyr 功能,而不是创建新功能。因此,我们采纳了许多来自 sparklyr 用户的宝贵建议,并在一系列错误修复和改进中成功解决了这些问题。

使用 torch 进行脑图像分割

Brain image segmentation with torch

各种科学及其应用都需要对图像进行分割,其中许多对人类(和动物)生命至关重要。在这篇介绍性文章中,我们训练了一个 U-Net 来标记 MRI 脑部扫描中的病变区域。

用于表格数据的 torch

torch for tabular data

如何避免死于毒蘑菇。 另外:如何使用 torch 对表格数据进行深度学习,包括分类和数字特征的混合。